home *** CD-ROM | disk | FTP | other *** search
/ Super PC 34 / Super PC 34 (Shareware).iso / spc / UTIL / DJGPP2 / V2 / DJLSR200.ZIP / src / debug / edebug / unassmbl.c < prev    next >
Encoding:
C/C++ Source or Header  |  1995-03-21  |  28.7 KB  |  1,119 lines

  1. /* Copyright (C) 1995 DJ Delorie, see COPYING.DJ for details */
  2. /*
  3. ** Copyright (C) 1993 DJ Delorie, 24 Kirsten Ave, Rochester NH 03867-2954
  4. **
  5. ** This file is distributed under the terms listed in the document
  6. ** "copying.dj", available from DJ Delorie at the address above.
  7. ** A copy of "copying.dj" should accompany this file; if not, a copy
  8. ** should be available from where this file was obtained.  This file
  9. ** may not be distributed without a verbatim copy of "copying.dj".
  10. **
  11. ** This file is distributed WITHOUT ANY WARRANTY; without even the implied
  12. ** warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
  13. */
  14.  
  15. #include <stdio.h>
  16. #include <string.h>
  17.  
  18. #include "ed.h"
  19. #include "unassmbl.h"
  20. #include <debug/syms.h>
  21.  
  22. #define SOURCE_LIST
  23.  
  24. int seg_size=32;
  25.  
  26. static word8 buf[20];
  27. static word32 vaddr;
  28. static int bufp, bufe;
  29. static char ubuf[100], *ubufp;
  30. static col;
  31.  
  32. static void ua_str(const char *s);
  33.  
  34. /* Percent tokens in strings:
  35.    First char after '%':
  36.         A - direct address
  37.         C - reg of r/m picks control register
  38.         D - reg of r/m picks debug register
  39.         E - r/m picks operand
  40.         F - flags register
  41.         G - reg of r/m picks general register
  42.         I - immediate data (takes extended size, data size)
  43.         J - relative IP offset
  44.         M - r/m picks memory
  45.         O - no r/m, offset only
  46.         R - mod of r/m picks register only
  47.         S - reg of r/m picks segment register
  48.         T - reg of r/m picks test register
  49.         X - DS:ESI
  50.         Y - ES:EDI
  51.         2 - prefix of two-byte opcode
  52.         e - put in 'e' if use32 (second char is part of reg name)
  53.             put in 'w' for use16 or 'd' for use32 (second char is 'w')
  54.         f - floating point (second char is esc value)
  55.         g - do r/m group 'n'
  56.         p - prefix
  57.         s - size override (second char is a,o)
  58.         + - make default signed
  59.    Second char after '%':
  60.         a - two words in memory (BOUND)
  61.         b - byte
  62.         c - byte or word
  63.         d - dword
  64.         p - 32 or 48 bit pointer
  65.         s - six byte pseudo-descriptor
  66.         v - word or dword
  67.         w - word
  68.         F - use floating regs in mod/rm
  69.         + - always sign
  70.         - - sign if negative
  71.         1-8 - group number, esc value, etc
  72. */
  73.  
  74. const char *opmap1[] = {
  75. /* 0 */
  76.   "add %Eb,%Gb", "add %Ev,%Gv", "add %Gb,%Eb", "add %Gv,%Ev",
  77.   "add al,%I-bb", "add %eax,%I-vv", "push es", "pop es",
  78.   "or %Eb,%Gb", "or %Ev,%Gv", "or %Gb,%Eb", "or %Gv,%Ev",
  79.   "or al,%Ibb", "or %eax,%Ivv", "push cs", "%2 ",
  80. /* 1 */
  81.   "adc %Eb,%Gb", "adc %Ev,%Gv", "adc %Gb,%Eb", "adc %Gv,%Ev",
  82.   "adc al,%I-bb", "adc %eax,%I-vv", "push ss", "pop ss",
  83.   "sbb %Eb,%Gb", "sbb %Ev,%Gv", "sbb %Gb,%Eb", "sbb %Gv,%Ev",
  84.   "sbb al,%I-bb", "sbb %eax,%I-vv", "push ds", "pop ds",
  85. /* 2 */
  86.   "and %Eb,%Gb", "and %Ev,%Gv", "and %Gb,%Eb", "and %Gv,%Ev",
  87.   "and al,%Ibb", "and %eax,%Ivv", "%pe", "daa",
  88.   "sub %Eb,%Gb", "sub %Ev,%Gv", "sub %Gb,%Eb", "sub %Gv,%Ev",
  89.   "sub al,%I-bb", "sub %eax,%I-vv", "%pc", "das",
  90. /* 3 */
  91.   "xor %Eb,%Gb", "xor %Ev,%Gv", "xor %Gb,%Eb", "xor %Gv,%Ev",
  92.   "xor al,%Ibb", "xor %eax,%Ivv", "%ps", "aaa",
  93.   "cmp %Eb,%Gb", "cmp %Ev,%Gv", "cmp %Gb,%Eb", "cmp %Gv,%Ev",
  94.   "cmp al,%I-bb", "cmp %eax,%I-vv", "%pd", "aas",
  95. /* 4 */
  96.   "inc %eax", "inc %ecx", "inc %edx", "inc %ebx",
  97.   "inc %esp", "inc %ebp", "inc %esi", "inc %edi",
  98.   "dec %eax", "dec %ecx", "dec %edx", "dec %ebx",
  99.   "dec %esp", "dec %ebp", "dec %esi", "dec %edi",
  100. /* 5 */
  101.   "push %eax", "push %ecx", "push %edx", "push %ebx",
  102.   "push %esp", "push %ebp", "push %esi", "push %edi",
  103.   "pop %eax", "pop %ecx", "pop %edx", "pop %ebx",
  104.   "pop %esp", "pop %ebp", "pop %esi", "pop %edi",
  105. /* 6 */
  106.   "pusha", "popa", "bound %Gv,%Ma", "arpl %Ew,%Rw",
  107.   "%pf", "%pg", "%so", "%sa",
  108.   "push %I-vv", "imul %Gv=%Ev*%I-vv", "push %I-vb", "imul %Gv=%Ev*%I-vb",
  109.   "insb %Yb,dx", "ins%ew %Yv,dx", "outsb dx,%Xb", "outs%ew dx,%Xv",
  110. /* 7 */
  111.   "jo %Jb", "jno %Jb", "jc %Jb", "jnc %Jb",
  112.   "jz %Jb", "jnz %Jb", "jbe %Jb", "jnbe %Jb",
  113.   "js %Jb", "jns %Jb", "jpe %Jb", "jpo %Jb",
  114.   "jl %Jb", "jge %Jb", "jle %Jb", "jg %Jb",
  115. /* 8 */
  116.   "%g1 %Eb,%Ibb", "%g1 %Ev,%Ivv", 0, "%g1 %Ev,%Ivb",
  117.   "test %Eb,%Gb", "test %Ev,%Gv", "xchg %Eb,%Gb", "xchg %Ev,%Gv",
  118.   "mov %Eb,%Gb", "mov %Ev,%Gv", "mov %Gb,%Eb", "mov %Gv,%Ev",
  119.   "mov %Ew,%Sw", "lea %Gv,%M ", "mov %Sw,%Ew", "pop %Ev",
  120. /* 9 */
  121.   "nop", "xchg %eax,%ecx", "xchg %eax,%edx", "xchg %eax,%ebx",
  122.   "xchg %eax,%esp", "xchg %eax,%ebp", "xchg %eax,%esi", "xchg %eax,%edi",
  123.   "cbw", "cwd", "call %Ap", "fwait",
  124.   "push %eflags", "pop %eflags", "sahf", "lahf",
  125. /* a */
  126.   "mov al,%Ob", "mov %eax,%Ov", "mov %Ob,al", "mov %Ov,%eax",
  127.   "movsb %Xb,%Yb", "movs%ew %Xv,%Yv", "cmpsb %Xb,%Yb", "cmps%ew %Xv,%Yv",
  128.   "test al,%Ibb", "test %eax,%Ivv", "stosb %Yb,al", "stos%ew %Yv,%eax",
  129.   "lodsb al,%Xb", "lods%ew %eax,%Xv", "scasb al,%Xb", "scas%ew %eax,%Xv",
  130. /* b */
  131.   "mov al,%Ibb", "mov cl,%Ibb", "mov dl,%Ibb", "mov bl,%Ibb",
  132.   "mov ah,%Ibb", "mov ch,%Ibb", "mov dh,%Ibb", "mov bh,%Ibb",
  133.   "mov %eax,%I-vv", "mov %ecx,%I-vv", "mov %edx,%I-vv", "mov %ebx,%I-vv",
  134.   "mov %esp,%Ivv", "mov %ebp,%Ivv", "mov %esi,%I-vv", "mov %edi,%I-vv",
  135. /* c */
  136.   "%g2 %Eb,%Ibb", "%g2 %Ev,%Ibb", "ret %Iw", "ret",
  137.   "les %Gv,%Mp", "lds %Gv,%Mp", "mov %Eb,%Ibb", "mov %Ev,%I-vv",
  138.   "enter %Iww,%Ibb", "leave", "retf %Iww", "retf",
  139.   "int 3", "int %Ibb", "into", "iret",
  140. /* d */
  141.   "%g2 %Eb,1", "%g2 %Ev,1", "%g2 %Eb,cl", "%g2 %Ev,cl",
  142.   "aam %Ibb", "aad %Ibb", 0, "xlat",
  143.   "%f0", "%f1", "%f2", "%f3",
  144.   "%f4", "%f5", "%f6", "%f7",
  145. /* e */
  146.   "loopne %Jb", "loope %Jb", "loop %Jb", "jcxz %Jb",
  147.   "in al,%Ibb", "in %eax,%Ibb", "out %Ibb,al", "out %Ibb,%eax",
  148.   "call %Jv", "jmp %Jv", "jmp %Ap", "jmp %Jb",
  149.   "in al,dx", "in %eax,dx", "out dx,al", "out dx,%eax",
  150. /* f */
  151.   "lock %p ", 0, "repne %p ", "rep(e) %p ",
  152.   "hlt", "cmc", "%g3", "%g0",
  153.   "clc", "stc", "cli", "sti",
  154.   "cld", "std", "%g4", "%g5"
  155.   };
  156.  
  157. const char *second[] = {
  158. /* 0 */
  159.   "%g6", "%g7", "lar %Gv,%Ew", "lsl %Gv,%Ew", 0, 0, "clts", 0,
  160.   0, 0, 0, 0, 0, 0, 0, 0,
  161. /* 1 */
  162.   0, 0, 0, 0, 0, 0, 0, 0,
  163.   0, 0, 0, 0, 0, 0, 0, 0,
  164. /* 2 */
  165.   "mov %Rd,%Cd", "mov %Rd,%Dd", "mov %Cd,%Rd", "mov %Dd,%Rd",
  166.   "mov %Rd,%Td", 0, "mov %Td,%Rd", 0,
  167.   0, 0, 0, 0, 0, 0, 0, 0,
  168. /* 3 */
  169.   0, 0, 0, 0, 0, 0, 0, 0,
  170.   0, 0, 0, 0, 0, 0, 0, 0,
  171.   0, 0, 0, 0, 0, 0, 0, 0,
  172.   0, 0, 0, 0, 0, 0, 0, 0,
  173.   0, 0, 0, 0, 0, 0, 0, 0,
  174.   0, 0, 0, 0, 0, 0, 0, 0,
  175.   0, 0, 0, 0, 0, 0, 0, 0,
  176.   0, 0, 0, 0, 0, 0, 0, 0,
  177.   0, 0, 0, 0, 0, 0, 0, 0,
  178.   0, 0, 0, 0, 0, 0, 0, 0,
  179. /* 8 */
  180.   "jo %Jv", "jno %Jv", "jc %Jv", "jnc %Jv",
  181.   "jz %Jv", "jnz %Jv", "jbe %Jv", "jnbe %Jv",
  182.   "js %Jv", "jns %Jv", "jpe %Jv", "jpo %Jv",
  183.   "jl %Jv", "jge %Jv", "jle %Jv", "jg %Jv",
  184. /* 9 */
  185.   "seto %Eb", "setno %Eb", "setc %Eb", "setnc %Eb",
  186.   "setz %Eb", "setnz %Eb", "setbe %Eb", "setnbe %Eb",
  187.   "sets %Eb", "setns %Eb", "setp %Eb", "setnp %Eb",
  188.   "setl %Eb", "setge %Eb", "setle %Eb", "setg %Eb",
  189. /* a */
  190.   "push fs", "pop fs", 0, "bt %Ev,%Gv",
  191.   "shld %Ev,%Gv,%Ibb", "shld %Ev,%Gv,cl", 0, 0,
  192.   "push gs", "pop gs", 0, "bts %Ev,%Gv",
  193.   "shrd %Ev,%Gv,%Ibb", "shrd %Ev,%Gv,cl", 0, "imul %Gv,%Ev",
  194. /* b */
  195.   0, 0, "lss %Mp", "btr %Ev,%Gv",
  196.   "lfs %Mp", "lgs %Mp", "movzx %Gv,%Eb", "movzx %Gv,%Ew",
  197.   0, 0, "%g8 %Ev,%Ibb", "btc %Ev,%Gv",
  198.   "bsf %Gv,%Ev", "bsr %Gv,%Ev", "movsx %Gv,%Eb", "movsx %Gv,%Ew",
  199. /* c */
  200.   0, 0, 0, 0, 0, 0, 0, 0,
  201.   0, 0, 0, 0, 0, 0, 0, 0,
  202.   0, 0, 0, 0, 0, 0, 0, 0,
  203.   0, 0, 0, 0, 0, 0, 0, 0,
  204.   0, 0, 0, 0, 0, 0, 0, 0,
  205.   0, 0, 0, 0, 0, 0, 0, 0,
  206.   0, 0, 0, 0, 0, 0, 0, 0,
  207.   0, 0, 0, 0, 0, 0, 0, 0,
  208.   };
  209.  
  210. const char *groups[][8] = {     /* group 0 is group 3 for %Ev set */
  211.   { "test %Ev,%Ivv", "test %Ev,%Ivv,", "not %Ev", "neg %Ev",
  212.     "mul %eax,%Ev", "imul %eax,%Ev", "div %eax,%Ev", "idiv %eax,%Ev" },
  213.   { "add%+-", "or", "adc%+-", "sbb%+-", "and", "sub%+-", "xor", "cmp%+-" },
  214.   { "rol", "ror", "rcl", "rcr", "shl", "shr", "shl", "sar" },
  215.   { "test %Eb,%Ibb", "test %Eb,%Ibb,", "not %Eb", "neg %Eb",
  216.     "mul al,%Eb", "imul al,%Eb", "div al,%Eb", "idiv al,%Eb" },
  217.   { "inc %Eb", "dec %Eb", 0, 0, 0, 0, 0, 0 },
  218.   { "inc %Ev", "dec %Ev", "call %Ev", "call %Ep",
  219.     "jmp %Ev", "jmp %Ep", "push %Ev", 0 },
  220.   { "sldt %Ew", "str %Ew", "lldt %Ew", "ltr %Ew",
  221.     "verr %Ew", "verw %Ew", 0, 0 },
  222.   { "sgdt %Ms", "sidt %Ms", "lgdt %Ms", "lidt %Ms",
  223.     "smsw %Ew", 0, "lmsw %Ew", 0 },
  224.   { 0, 0, 0, 0, "bt", "bts", "btr", "btc" }
  225.   };
  226.  
  227. /* zero here means invalid.  If first entry starts with '*', use st(i) */
  228. /* no assumed %EFs here.  Indexed by rm(modrm()) */
  229. const char *f0[] = {0, 0, 0, 0, 0, 0, 0, 0};
  230. const char *fop_9[]  = { "*fxch st,%GF" };
  231. const char *fop_10[] = { "fnop", 0, 0, 0, 0, 0, 0, 0 };
  232. const char *fop_12[] = { "fchs", "fabs", 0, 0, "ftst", "fxam", 0, 0 };
  233. const char *fop_13[] = { "fld1", "fldl2t", "fldl2e", "fldpi",
  234.                          "fldlg2", "fldln2", "fldz", 0 };
  235. const char *fop_14[] = { "f2xm1", "fyl2x", "fptan", "fpatan",
  236.                          "fxtract", "fprem1", "fdecstp", "fincstp" };
  237. const char *fop_15[] = { "fprem", "fyl2xp1", "fsqrt", "fsincos",
  238.                          "frndint", "fscale", "fsin", "fcos" };
  239. const char *fop_21[] = { 0, "fucompp", 0, 0, 0, 0, 0, 0 };
  240. const char *fop_28[] = { 0, 0, "fclex", "finit", 0, 0, 0, 0 };
  241. const char *fop_32[] = { "*fadd %GF,st" };
  242. const char *fop_33[] = { "*fmul %GF,st" };
  243. const char *fop_36[] = { "*fsubr %GF,st" };
  244. const char *fop_37[] = { "*fsub %GF,st" };
  245. const char *fop_38[] = { "*fdivr %GF,st" };
  246. const char *fop_39[] = { "*fdiv %GF,st" };
  247. const char *fop_40[] = { "*ffree %GF" };
  248. const char *fop_42[] = { "*fst %GF" };
  249. const char *fop_43[] = { "*fstp %GF" };
  250. const char *fop_44[] = { "*fucom %GF" };
  251. const char *fop_45[] = { "*fucomp %GF" };
  252. const char *fop_48[] = { "*faddp %GF,st" };
  253. const char *fop_49[] = { "*fmulp %GF,st" };
  254. const char *fop_51[] = { 0, "fcompp", 0, 0, 0, 0, 0, 0 };
  255. const char *fop_52[] = { "*fsubrp %GF,st" };
  256. const char *fop_53[] = { "*fsubp %GF,st" };
  257. const char *fop_54[] = { "*fdivrp %GF,st" };
  258. const char *fop_55[] = { "*fdivp %GF,st" };
  259. const char *fop_60[] = { "fstsw ax", 0, 0, 0, 0, 0, 0, 0 };
  260.  
  261. const char **fspecial[] = { /* 0=use st(i), 1=undefined 0 in fop_* means undefined */
  262.   0, 0, 0, 0, 0, 0, 0, 0,
  263.   0, fop_9, fop_10, 0, fop_12, fop_13, fop_14, fop_15,
  264.   f0, f0, f0, f0, f0, fop_21, f0, f0,
  265.   f0, f0, f0, f0, fop_28, f0, f0, f0,
  266.   fop_32, fop_33, f0, f0, fop_36, fop_37, fop_38, fop_39,
  267.   fop_40, f0, fop_42, fop_43, fop_44, fop_45, f0, f0,
  268.   fop_48, fop_49, f0, fop_51, fop_52, fop_53, fop_54, fop_55,
  269.   f0, f0, f0, f0, fop_60, f0, f0, f0,
  270.   };
  271.  
  272. const char *floatops[] = { /* assumed " %EF" at end of each.  mod != 3 only */
  273. /*00*/ "fadd", "fmul", "fcom", "fcomp",
  274.        "fsub", "fsubr", "fdiv", "fdivr",
  275. /*08*/ "fld", 0, "fst", "fstp",
  276.        "fldenv", "fldcw", "fstenv", "fstcw",
  277. /*16*/ "fiadd", "fimul", "ficomw", "ficompw",
  278.        "fisub", "fisubr", "fidiv", "fidivr",
  279. /*24*/ "fild", 0, "fist", "fistp",
  280.        "frstor", "fldt", 0, "fstpt",
  281. /*32*/ "faddq", "fmulq", "fcomq", "fcompq",
  282.        "fsubq", "fsubrq", "fdivq", "fdivrq",
  283. /*40*/ "fldq", 0, "fstq", "fstpq",
  284.        0, 0, "fsave", "fstsww",
  285. /*48*/ "fiaddw", "fimulw", "ficomw", "ficompw",
  286.        "fisubw", "fisubrw", "fidivw", "fidivr",
  287. /*56*/ "fildw", 0, "fistw", "fistpw",
  288.        "fbldt", "fildq", "fbstpt", "fistpq"
  289.   };
  290.  
  291. static word8 getbyte(void)
  292. {
  293.   int s;
  294.   if (bufp >= bufe)
  295.   {
  296.     s = 20;
  297.     if ((vaddr & 0xfff) + s > 0x1000)
  298.       s = 0x1000 - (vaddr & 0xfff);
  299.     read_child(vaddr, buf, s);
  300.     bufe = s;
  301.     bufp = 0;
  302.   }
  303.   vaddr++;
  304.   printf("%02x", buf[bufp]);
  305.   col+=2;
  306.   return buf[bufp++];
  307. }
  308.  
  309. static int default_pick_sign;
  310.  
  311. static prefix;
  312. static modrmv;
  313. static sibv;
  314. static opsize;
  315. static addrsize;
  316.  
  317. static int modrm(void)
  318. {
  319.   if (modrmv == -1)
  320.     modrmv = getbyte();
  321.   return modrmv;
  322. }
  323.  
  324. static int sib(void)
  325. {
  326.   if (sibv == -1)
  327.     sibv = getbyte();
  328.   return sibv;
  329. }
  330.  
  331. #define mod(a)  (((a)>>6)&7)
  332. #define reg(a)  (((a)>>3)&7)
  333. #define rm(a)   ((a)&7)
  334. #define ss(a)   (((a)>>6)&7)
  335. #define indx(a) (((a)>>3)&7)
  336. #define base(a) ((a)&7)
  337.  
  338. /*------------------------------------------------------------------------*/
  339. static void uprintf(const char *s, ...)
  340. {
  341.   const char **a = &s;
  342.   vsprintf(ubufp, s, a+1);
  343.   while (*ubufp) ubufp++;
  344. }
  345.  
  346. static void uputchar(char c)
  347. {
  348.   if (c == '\t')
  349.   {
  350.     do {
  351.       *ubufp++ = ' ';
  352.     } while ((ubufp-ubuf) % 8);
  353.   }
  354.   else
  355.     *ubufp++ = c;
  356.   *ubufp = 0;
  357. }
  358.  
  359. /*------------------------------------------------------------------------*/
  360. static int bytes(char c)
  361. {
  362.   switch (c)
  363.   {
  364.     case 'b':
  365.       return 1;
  366.     case 'w':
  367.       return 2;
  368.     case 'd':
  369.       return 4;
  370.     case 'v':
  371.       if (opsize == 32)
  372.         return 4;
  373.       else
  374.         return 2;
  375.   }
  376.   return 0;
  377. }
  378.  
  379. /*------------------------------------------------------------------------*/
  380. static void ohex(char c, int extend, int optional, int defsize, int sign)
  381. {
  382.   static const char *formats[4] = { "%#x", "%d", "%+d", "%+d" };
  383.   const char *fmt;
  384.   int n=0, s=0, i;
  385.   int32 delta;
  386.   unsigned char buf1[6];
  387.   char *name;
  388.   fmt = formats[sign];
  389.  
  390.   switch (c)
  391.   {
  392.     case 'a':
  393.       break;
  394.     case 'b':
  395.       n = 1;
  396.       break;
  397.     case 'w':
  398.       n = 2;
  399.       break;
  400.     case 'd':
  401.       n = 4;
  402.       break;
  403.     case 's':
  404.       n = 6;
  405.       break;
  406.     case 'c':
  407.     case 'v':
  408.       if (defsize == 32)
  409.         n = 4;
  410.       else
  411.         n = 2;
  412.       break;
  413.     case 'p':
  414.       if (defsize == 32)
  415.         n = 6;
  416.       else
  417.         n = 4;
  418.       s = 1;
  419.       break;
  420.     case 'x':
  421.       return;
  422.   }
  423.   for (i=0; i<n; i++)
  424.     buf1[i] = getbyte();
  425.   for (; i<extend; i++)
  426.     buf1[i] = (buf[i-1] & 0x80) ? 0xff : 0;
  427.   if (s)
  428.   {
  429.     uprintf("0x%02x%02x:", buf1[n-1], buf1[n-2]);
  430.     n -= 2;
  431.   }
  432.   switch (n)
  433.   {
  434.     case 1:
  435.       delta = *(signed char *)buf1;
  436.       break;
  437.    case 2:
  438.       delta = *(signed short *)buf1;
  439.       break;
  440.     case 4:
  441.       delta = *(signed long *)buf1;
  442.       break;
  443.   }
  444.   if (extend > n)
  445.   {
  446.     if (delta || !optional)
  447.     {
  448.       uprintf(fmt, delta);
  449.     }
  450.     return;
  451.   }
  452.   if ((n == 4) && sign < 2)
  453.   {
  454.     name = syms_val2name(delta, &delta);
  455.     if (name)
  456.     {
  457.       uprintf("%s", name);
  458.       if (delta)
  459.         uprintf("+%lu", delta);
  460.       return;
  461.     }
  462.   }
  463.   switch (n)
  464.   {
  465.     case 1:
  466.       uprintf(fmt, (unsigned char)delta);
  467.       break;
  468.     case 2:
  469.       uprintf(fmt, (unsigned short)delta);
  470.       break;
  471.     case 4:
  472.       uprintf(fmt, (unsigned long)delta);
  473.       break;
  474.   }
  475. }
  476.  
  477. /*------------------------------------------------------------------------*/
  478.  
  479. static const char *reg_names[3][8]={
  480.   {"al","cl","dl","bl","ah","ch","dh","bh"},
  481.   {"ax","cx","dx","bx","sp","bp","si","di"},
  482.   {"eax","ecx","edx","ebx","esp","ebp","esi","edi"} };
  483.  
  484. static void reg_name(int which, char size)
  485. {
  486.   if (size == 'F')
  487.   {
  488.     uprintf("st(%d)", which);
  489.     return;
  490.   }
  491.   if (((size == 'v') && (opsize == 32)) || (size == 'd'))
  492.   {
  493.     uputchar('e');
  494.   }
  495.   if (size == 'b')
  496.   {
  497.     uputchar("acdbacdb"[which]);
  498.     uputchar("llllhhhh"[which]);
  499.   }
  500.   else
  501.   {
  502.     uputchar("acdbsbsd"[which]);
  503.     uputchar("xxxxppii"[which]);
  504.   }
  505. }
  506.  
  507. /*------------------------------------------------------------------------*/
  508. static int do_sib(int m)
  509. {
  510.   static const char *i_str[] = {
  511.     "+eax", "+ecx", "+edx", "+ebx", "", "+ebp", "+esi", "+edi" };
  512.   int pick_signed = default_pick_sign;
  513.   int s, i, b, extra=0;
  514.   s = ss(sib());
  515.   i = indx(sib());
  516.   b = base(sib());
  517.   if (b == 5)
  518.   {
  519.       if (m == 0)
  520.       {
  521.         ua_str("%p:[");
  522.         ohex('d', 4, 0, addrsize, 1);
  523.       }
  524.       else
  525.       {
  526.         ua_str("%p:[ebp");
  527.         pick_signed |= 2;
  528.       }
  529.   }
  530.   else
  531.   {
  532.     static const char *sib_str[] = {
  533.       "%p:[eax", "%p:[ecx", "%p:[edx", "%p:[ebx", "%p:[esp", 0, "%p:[esi", "%p:[edi" };
  534.     pick_signed |= 2;
  535.     ua_str(sib_str[b]);
  536.     if ((b == i) && (b != 4) && (i != 5))
  537.       extra = 1;
  538.   }
  539.   if (extra == 0)
  540.   {
  541.     pick_signed |= 2;
  542.     uprintf(i_str[i]);
  543.   }
  544.   if (i != 4 && s)
  545.     uprintf("*%d", (1<<s)+extra);
  546.   return pick_signed;
  547. }
  548.  
  549. /*------------------------------------------------------------------------*/
  550.  
  551. static int modrm_extend;
  552.  
  553. static void do_modrm(char t)
  554. {
  555.   int m = mod(modrm());
  556.   int r = rm(modrm());
  557.   int extend = (addrsize == 32) ? 4 : 2;
  558.   int pick_signed = default_pick_sign;
  559.   if (m == 3)
  560.   {
  561.     reg_name(r, t);
  562.     return;
  563.   }
  564.   if ((m == 0) && (r == 5) && (addrsize == 32))
  565.   {
  566.     ua_str("%p:[");
  567.     ohex('d', extend, 0, addrsize, 0);
  568.     uputchar(']');
  569.     return;
  570.   }
  571.   if ((m == 0) && (r == 6) && (addrsize == 16))
  572.   {
  573.     ua_str("%p:[");
  574.     ohex('w', extend, 0, addrsize, 0);
  575.     uputchar(']');
  576.     return;
  577.   }
  578.   if ((addrsize != 32) || (r != 4))
  579.     ua_str("%p:[");
  580.   if (addrsize == 16)
  581.   {
  582.     static const char *r_str[] = {
  583.       "bx+si", "bx+di", "bp+si", "bp+di", "si", "di", "bp", "bx" };
  584.     uprintf(r_str[r]);
  585.     pick_signed |= 2;
  586.   }
  587.   else
  588.   {
  589.     if (r == 4)
  590.       pick_signed |= do_sib(m);
  591.     else
  592.     {
  593.       uprintf(reg_names[2][r]);
  594.       pick_signed |= 2;
  595.     }
  596.   }
  597.   modrm_extend = extend;
  598.   ohex("xbv"[m], extend, 1, addrsize, pick_signed);
  599.   uputchar(']');
  600. }
  601.  
  602. /*------------------------------------------------------------------------*/
  603. static void floating_point(int e1)
  604. {
  605.   int esc = e1*8 + reg(modrm());
  606.   if (mod(modrm()) == 3)
  607.   {
  608.     if (fspecial[esc])
  609.     {
  610.       if (fspecial[esc][0] && (fspecial[esc][0][0] == '*'))
  611.       {
  612.         ua_str(fspecial[esc][0]+1);
  613.       }
  614.       else
  615.       {
  616.         ua_str(fspecial[esc][rm(modrm())]);
  617.       }
  618.     }
  619.     else
  620.     {
  621.       ua_str(floatops[esc]);
  622.       ua_str(" %EF");
  623.     }
  624.   }
  625.   else
  626.   {
  627.     ua_str(floatops[esc]);
  628.     ua_str(" %EF");
  629.   }
  630. }
  631.  
  632. /*------------------------------------------------------------------------*/
  633. static void percent(char c, const char **tptr)
  634. {
  635.   word32 vofs, delta;
  636.   char *name;
  637.   int default_signed = default_pick_sign;
  638.   char t = *(*tptr)++, it;
  639.   int extend = (addrsize == 32) ? 4 : 2;
  640.   int iextend;
  641.  
  642.   if (c != '+')
  643.   {
  644.     if (t == '-')
  645.     {
  646.       default_signed = 1;
  647.       t = *(*tptr)++;
  648.     }
  649.     else if (t == '+')
  650.     {
  651.       default_signed = 2;
  652.       t = *(*tptr)++;
  653.     }
  654.   }
  655.   switch (c)
  656.   {
  657.     case 'A':
  658.       ohex(t, extend, 0, addrsize, 0);
  659.       break;
  660.     case 'C':
  661.       uprintf("cr%d", reg(modrm()));
  662.       break;
  663.     case 'D':
  664.       uprintf("dr%d", reg(modrm()));
  665.       break;
  666.     case 'E':
  667.       do_modrm(t);
  668.       break;
  669.     case 'G':
  670.       if (t == 'F')
  671.         reg_name(rm(modrm()), t);
  672.       else
  673.         reg_name(reg(modrm()), t);
  674.       break;
  675.     case 'I':
  676.       it = *(*tptr)++;
  677.       switch (t)
  678.       {
  679.         case 'b':
  680.           iextend = 1;
  681.           break;
  682.         case 'v':
  683.           iextend = extend;
  684.           break;
  685.         default:
  686.           iextend = 0;
  687.           break;
  688.       }
  689.       ohex(it, iextend, 0, opsize, default_signed);
  690.       break;
  691.     case 'J':
  692.       switch (bytes(t))
  693.       {
  694.         case 1:
  695.           vofs = (int8)getbyte();
  696.           break;
  697.         case 2:
  698.           vofs = getbyte();
  699.           vofs += getbyte()<<8;
  700.           vofs = (int16)vofs;
  701.           break;
  702.         case 4:
  703.           vofs = (word32)getbyte();
  704.           vofs |= (word32)getbyte() << 8;
  705.           vofs |= (word32)getbyte() << 16;
  706.           vofs |= (word32)getbyte() << 24;
  707.           break;
  708.         default:
  709.           vofs = 0;    /* To avoid uninit error */
  710.       }
  711.       name = syms_val2name(vofs+vaddr, &delta);
  712.       uprintf("%s", name);
  713.       if (delta)
  714.         uprintf("+%lu (0x%lx %c)", delta, vofs+vaddr,
  715.                 (vofs & 0x80000000UL) ? 0x1e : 0x1f);
  716.       break;
  717.     case 'M':
  718.       do_modrm(t);
  719.       break;
  720.     case 'O':
  721.       ua_str("%p:[");
  722.       ohex(t, extend, 0, addrsize, 0);
  723.       uputchar(']');
  724.       break;
  725.     case 'R':
  726.       do_modrm(t);
  727.       break;
  728.     case 'S':
  729.       uputchar("ecsdfg"[reg(modrm())]);
  730.       uputchar('s');
  731.       break;
  732.     case 'T':
  733.       uprintf("tr%d", reg(modrm()));
  734.       break;
  735.     case 'X':
  736.       uprintf("ds:[");
  737.       if (addrsize == 32)
  738.         uputchar('e');
  739.       uprintf("si]");
  740.       break;
  741.     case 'Y':
  742.       uprintf("es:[");
  743.       if (addrsize == 32)
  744.         uputchar('e');
  745.       uprintf("di]");
  746.       break;
  747.     case '2':
  748.       ua_str(second[getbyte()]);
  749.       break;
  750.     case 'e':
  751.       if (opsize == 32)
  752.       {
  753.         if (t == 'w')
  754.           uputchar('d');
  755.         else
  756.         {
  757.           uputchar('e');
  758.           uputchar(t);
  759.         }
  760.       }
  761.       else
  762.         uputchar(t);
  763.       break;
  764.     case 'f':
  765.       floating_point(t-'0');
  766.       break;
  767.     case 'g':
  768.       ua_str(groups[t-'0'][reg(modrm())]);
  769.       break;
  770.     case 'p':
  771.       switch (t)
  772.       {
  773.         case 'c':
  774.         case 'd':
  775.         case 'e':
  776.         case 'f':
  777.         case 'g':
  778.         case 's':
  779.           prefix = t;
  780.           ua_str(opmap1[getbyte()]);
  781.           break;
  782.         case ':':
  783.           if (prefix)
  784.             uprintf("%cs:", prefix);
  785.           break;
  786.         case ' ':
  787.           ua_str(opmap1[getbyte()]);
  788.           break;
  789.       }
  790.       break;
  791.     case 's':
  792.       switch (t)
  793.       {
  794.         case 'a':
  795.           addrsize = 48 - addrsize;
  796.           ua_str(opmap1[getbyte()]);
  797.           break;
  798.         case 'o':
  799.           opsize = 48 - opsize;
  800.           ua_str(opmap1[getbyte()]);
  801.           break;
  802.       }
  803.       break;
  804.     case '+':
  805.       switch (t)
  806.       {
  807.         case '-':
  808.           default_pick_sign = 1;
  809.           break;
  810.         case '+':
  811.           default_pick_sign = 2;
  812.           break;
  813.         default:
  814.           default_pick_sign = 0;
  815.           break;
  816.       }
  817.   }
  818. }
  819.  
  820. static void ua_str(const char *s)
  821. {
  822.   int c;
  823.   if (s == 0)
  824.   {
  825.     uprintf("<invalid>");
  826.     return;
  827.   }
  828.   while ((c = *s++) != 0)
  829.   {
  830.     if (c == '%')
  831.     {
  832.       c = *s++;
  833.       percent(c, &s);
  834.     }
  835.     else
  836.       if (c == ' ')
  837.         uputchar('\t');
  838.       else
  839.         uputchar(c);
  840.   }
  841. }
  842.  
  843. #ifdef SOURCE_LIST
  844. /*
  845. ** A little brute force hacking and hey presto! A source debugger!
  846. ** Courtesy of Kent Williams williams@herky.cs.uiowa.edu
  847. **
  848. ** KNOWN BUGS:
  849. ** The program will summarily terminate if you run out
  850. ** of memory while you're looking for all the line offsets.  Since
  851. ** a two thousand line source file only creats an 8K array, and the
  852. ** symbol table goes into virtual memory, this shouldn't happen too
  853. ** often.
  854. **
  855. ** One file is left open for reading indefinitely.
  856. */
  857. #include <stdlib.h>
  858. #include <string.h>
  859. /*
  860. ** keep the source line offsets in virtual memory, so you can
  861. ** debug big programs
  862. */
  863. extern word32 salloc(word32 size);
  864. #define symsput(where,ptr,size)     memput(where,ptr,size)
  865. #define symsget(where,ptr,size)     memget(where,ptr,size)
  866.  
  867. /*
  868. ** for each file encountered, keep an array of line start offsets
  869. ** so you can seek into the file to display the current line.
  870. */
  871. typedef struct {
  872.         char *filename;
  873.         long *offsets;
  874. } line_info;
  875.  
  876. static line_info *files;
  877. static last_file = 0;
  878.  
  879. /*
  880. ** add_file -- add a file to the source line database
  881. */
  882. static int
  883. add_file(char *name) {
  884.         FILE *f = fopen(name,"rb");
  885.         char c;
  886.         long *lines,curpos;
  887.         unsigned curline = 0;
  888.  
  889.         if(!f)
  890.                 return -1;
  891.  
  892.         if (files == 0)
  893.           files = (line_info *)malloc(sizeof(line_info));
  894.         else
  895.           files = realloc(files, (last_file+1) * sizeof(line_info));
  896.  
  897.         files[last_file].filename = (char *)malloc(strlen(name)+1);
  898.         strcpy(files[last_file].filename, name);
  899.  
  900.         /*
  901.         ** build an array of line offsets in real memory.
  902.         */
  903.         lines = malloc(sizeof(long));
  904.         lines[curline++] = curpos = 0L;
  905.  
  906.         while((c = getc(f)) != EOF) {
  907.                 curpos++;
  908.                 if(c == '\n') {
  909.                         lines = realloc(lines,sizeof(long)*(curline+1));
  910.                         lines[curline++] = curpos;
  911.                 }
  912.         }
  913.         /*
  914.         ** now move the whole array into virtual memory
  915.         */
  916.         files[last_file].offsets = lines;
  917.         fclose(f);
  918.  
  919.         last_file++;
  920.         return 0;
  921. }
  922.  
  923. static line_info *
  924. find_file(char *name) {
  925.         int i;
  926.         for(i = 0; i < last_file; i++)
  927.                 if(strcmp(name,files[i].filename) == 0)
  928.                         return &files[i];
  929.         if(add_file(name) == -1)
  930.                         return NULL;
  931.         return find_file(name);
  932. }
  933.  
  934. /*
  935. ** myfopen -- cache the most recently accessed source file
  936. ** so you aren't constantly reopening a new file
  937. */
  938. static FILE *
  939. myfopen(char *name) {
  940.         static char fname[80] = "";
  941.         static FILE *current = NULL;
  942.         if(current != NULL && strcmp(fname,name) == 0)
  943.                         return current;
  944.         if(current != NULL) fclose(current);
  945.         strcpy(fname,name);
  946.         return (current = fopen(name,"rb"));
  947. }
  948.  
  949. /*
  950. ** put_source_line -- print the current source line, along with
  951. ** the line # and file name, if necessary.
  952. */
  953. static void
  954. put_source_line(int fmt,char *name,int line) {
  955.         line_info *current = find_file(name);
  956.         FILE *cur;
  957.         if(current == NULL) {
  958.         regular:
  959.           if(fmt == 0)
  960.                   printf(" (%s#%d):\n", name, line);
  961.           else
  962.                   printf("#%d:\n", line);
  963.         } else {
  964.                 char buf1[70];
  965.                 long offset;
  966.                 if((cur = myfopen(name)) == NULL)
  967.                         goto regular;
  968.                 /*
  969.                 ** get the symbol out of virtual memory
  970.                 */
  971.                 offset = current->offsets[line-1];
  972.                 fseek(cur,offset,0);
  973.                 /*
  974.                 ** truncate line so it fits on screen.
  975.                 */
  976.                 fgets(buf1,sizeof(buf1)-2,cur);
  977.                 if(strchr(buf1,'\n') == NULL)
  978.                         strcat(buf1,"\n");
  979.                 if(fmt == 0)
  980.                         printf(" (%s#%d): %s", name, line,buf1);
  981.                 else
  982.                         printf("#%d: %s",line,buf1);
  983.         }
  984. }
  985.  
  986. #endif
  987.  
  988.  
  989. int last_unassemble_unconditional;
  990. int last_unassemble_jump;
  991. int last_unassemble_extra_lines;
  992.  
  993. word32 unassemble(word32 v, int showregs)
  994. {
  995.   int a,b,n,wi, linenum;
  996.   char *cmp, *brp;
  997.   word8 *wp;
  998.   word32 delta;
  999.   char *name, *lname;
  1000.  
  1001.   default_pick_sign = 0;
  1002.   ansi(A_yellow);
  1003.   last_unassemble_unconditional = 0;
  1004.   last_unassemble_jump = 0;
  1005.   last_unassemble_extra_lines = 0;
  1006.   name = syms_val2name(v, &delta);
  1007.   if (!delta && (name[0] != '0'))
  1008.   {
  1009.     printf("%s()", name);
  1010.     lname = syms_val2line(v, &linenum, 1);
  1011.     if (lname)
  1012. #ifndef SOURCE_LIST
  1013.       printf(" (%s#%d):\n", lname, linenum);
  1014. #else
  1015.       put_source_line(0,lname,linenum);
  1016. #endif
  1017.     else
  1018.       printf(":\n");
  1019.     last_unassemble_extra_lines++;
  1020.   }
  1021.   else
  1022.   {
  1023.     lname = syms_val2line(v, &linenum, 1);
  1024.     if (lname)
  1025.     {
  1026. #ifndef SOURCE_LIST
  1027.       printf("#%d:\n", linenum);
  1028. #else
  1029.       put_source_line(1,lname,linenum);
  1030. #endif
  1031.       last_unassemble_extra_lines++;
  1032.     }
  1033.   }
  1034.  
  1035.   ansi(A_grey);
  1036.   printf("%08lx: ", v);
  1037. #if 0
  1038.   if (!page_is_valid(v+ARENA) || !page_is_valid(v+5+ARENA))
  1039.   {
  1040.     printf("<bad address>\n");
  1041.     return v;
  1042.   }
  1043. #endif
  1044.  
  1045.   prefix = 0;
  1046.   modrmv = sibv = -1;
  1047.   opsize = addrsize = seg_size;
  1048.   vaddr = v;
  1049.   bufp = bufe = 0;
  1050.   col = 0;
  1051.   ubufp = ubuf;
  1052.   ua_str(opmap1[getbyte()]);
  1053.   do {
  1054.     putchar(' ');
  1055.     col++;
  1056.   } while (col < 15);
  1057.   col += strlen(ubuf);
  1058.   do {
  1059.     uputchar(' ');
  1060.     col++;
  1061.   } while (col < 43);
  1062.  
  1063.   ansi(A_cyan);
  1064.   printf("%s", ubuf);
  1065.   ansi(A_grey);
  1066.  
  1067.   if ((strncmp(ubuf, "jmp ", 4) == 0)
  1068.      || (strncmp(ubuf, "ret", 3) == 0))
  1069.     last_unassemble_unconditional = 1;
  1070.   if (ubuf[0] == 'j')
  1071.     last_unassemble_jump = 1;
  1072.  
  1073.   if (!showregs)
  1074.   {
  1075.     putchar('\n');
  1076.     return vaddr;
  1077.   }
  1078.  
  1079.   col -= 43; /* total 25 columns left */
  1080.   wp = (word8 *)&(a_tss.tss_eax);
  1081.   cmp = strchr(ubuf+8, ',');
  1082.   brp = strchr(ubuf+8, '[');
  1083.   if (!cmp) cmp = ubuf+8;
  1084.   if (!brp) brp = ubufp;
  1085.   if (brp < cmp) cmp = brp;
  1086.   if (strncmp(ubuf, "mov ", 4))
  1087.     cmp = ubuf+8;
  1088.   for (b=0; b<8; b++)
  1089.   {
  1090.     for (a=2; a>=0; a--)
  1091.     {
  1092.       n = (a==0) ? 1 : ((a==1) ? 2 : 4);
  1093.       if (strstr(cmp, reg_names[a][b]))
  1094.       {
  1095.         col += strlen(reg_names[a][b])+n*2+2;
  1096.         if (col > 29)
  1097.         {
  1098.           printf("\n%53s", "");
  1099.           col = 0;
  1100.         }
  1101.         printf("%s=", reg_names[a][b]);
  1102.         if (a == 0)
  1103.           wi = (b&3)*4 + (b>>2);
  1104.         else
  1105.           wi = b*4;
  1106.         while (n)
  1107.         {
  1108.           n--;
  1109.           printf("%02x", wp[wi+n]);
  1110.         }
  1111.         putchar(' ');
  1112.         break;
  1113.       }
  1114.     }
  1115.   }
  1116.   putchar('\n');
  1117.   return vaddr;
  1118. }
  1119.